Кобрин Александр Исаакович

    111250, Россия, г. Москва, Красноказарменная ул., д. 14
    KobrinAI@mpei.ru
    Национальный исследовательский университет «Московский энергетический институт»

    Публикации:

    Синявский  О. Ю., Кобрин  А. И.
    Подробнее
    Вработе описываются методы обучения с подкреплением спайковой нейронной сети, управляющей роботом или интеллектуальным агентом. Применение спайковых нейронов в качестве базовых элементов сети позволяет использовать как пространственную, так и временную структуру входной сенсорной информации. Обучение сети производится с помощью подкрепляющих сигналов, идущих из внешней среды и отражающих степень успешности недавно выполненных агентом действий. Максимизация получаемого подкрепления ведется путем модулированной минимизации информационной энтропии функционирования нейрона, которая зависит от весов нейронов. Полученные законы изменения весов близки к явлениям синаптической пластичности, наблюдающейся в реальных нейронах. Работа алгоритма обучения с подкреплением проверяется на тестовой задаче поиска ресурсов агентом в дискретной виртуальной среде.
    Ключевые слова: спайковый нейрон, адаптивное управление, обучение с подкреплением, информационная энтропия
    Цитирование: Синявский  О. Ю., Кобрин  А. И.,  Обучение с подкреплением спайковой нейронной сети в задаче управления агентом в дискретной виртуальной среде, Нелинейная динамика, 2011, т. 7, № 4, с.  859-875
    DOI:10.20537/nd1104009

    Вернуться к списку